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摘 ， 要 :【 目 的/ 意义] 学 术 论 文 贡献 句 是 体现 论文 创新 性 和 学 术 价值 的 重要 形式 。 以 学 术 论文 全 文本 和 MeSH. 主题 词 为 


数据 基础 ,利用 自然 语言 处 理 和 深度 学 习 技 术 , 实 现 学 术 论文 贡献 名 识别 ,为 学 术 文本 创新 贡献 内 容 的 细 粒 度 挖 
握 黄 定 基础 ,对 实现 基于 认 知 计算 的 学 术 论文 评价 具有 重要 的 理论 和 现实 意义 。 | 方法“ 过程] 首先 ,以 PubMed 论 


文 全 文本 为 数据 来 源 ,抽取 论文 Mesh 主题 词 ,对 论文 贡献 名 进行 要 素 io ao 
现 标注 数据 。 最 后 ,基于 Albert 深度 学 习 模 型 实现 贡献 多 的 自动 识别 。 [55 


其 次 ,采用 半自动 方式 实 
结论 ] 通过 数据 一 致 性 检验 证 明 实 


验 标注 的 训练 数据 的 可 信和 性 ,实验 结果 表明 , 相 较 于 其 他 深度 学 习 模 型 , 训 的 自动 识别 模型 能 够 更 有 效 识 别 学 


论文 中 贡献 多。 
Den: “i 学 术 论文 “创新 性 Albert 
ke. C251.2 
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( 


贡献 价值 的 核心 要 义 , 创 新 是 具有 研究 贡献 的 论文 中 
不 可 或 缺 的 重要 组 成 部 分 。 由 于 衡量 论文 的 创新 性 需 
要 综合 考虑 多 种 因素 ,创新 的 发 现存 在 一 定 的 时 湿性 


A j 近 年 来 ,科技 评价 的 改革 日 益 受 到 有 关 部 门 和 学 
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NIMM bod s 
p 学 术 价 值 .学 术 影响 以 及 社会 影响 、 
应 用 价值 等 的 综合 评估 。 

学 术 论 文 的 贡献 是 论文 创新 性 、 科 学 性 和 学 术 价 
值 的 集中 体现 ,学 术 论文 的 贡献 价值 体现 在 作者 提出 
的 新 理论 .新 方法 .新 技术 `. 新 成 果 ,新 应 用 等 创新 贡献 
要 素 对 人 类 社会 发 展 与 科技 进步 所 带 来 的 社会 价值 与 
经 济 效益 。 学 术 论 文 创新 性 评价 是 学 术 评价 的 一 项 重 
要 任务 ,创新 的 评价 与 度量 是 一 项 复杂 的 系统 工程 ,其 
中 包括 创新 性 本 映 的 复杂 性 ,以 及 评价 的 过 程 和 要 素 
的 多 样 性 和 不 确定 性 。 创 新 评价 与 度量 旨 在 评价 创新 
的 “意义 ”或 “价值 ”, 即 该 研究 对 已 有 的 科研 环境 和 知 
识 体 系 所 作 的 研究 贡献 。 可 见 学 术 论 文 的 创新 是 论文 


和 不 确定 性 ,导致 科研 创新 发 现 工作 往往 具有 严重 的 
滞后 性 。 但 是 ,在 创新 内 容 的 发 现 过 程 中 ,创新 要 素 的 
描述 通常 体现 了 论文 的 贡献 价值 ,对 单 篇 学 术 论 文 而 
言 ,者 要 实现 内 容 层 面 的 创新 性 评价 ,需要 准确 地 找到 
学 术 论 文中 的 贡献 描述 句 , 即 直接 描述 或 能 体现 潜在 
创新 价值 的 句子 。 

目前 ,国内 外 关于 学 术 论文 创新 贡献 点 抽取 或 识 
别 的 直接 研究 较 少 ,相关 研究 主要 体现 在 创新 点 识别 、 
亮点 名 识别、 创新 研究 评价 句 方法 名 识别 等 方面 。 贡 
献 句 是 论文 创新 内 容 的 重要 承载 形式 ,有 效 地 识别 论 
文 的 学 术 贡 献 是 创新 评价 研究 的 前 提 , 将 为 创新 内 容 
的 精准 识别 提供 理论 与 数据 基础 。 医 学 主题 词 表 
( 


Medical Subject Headings , MeSH ) ,是 美国 国立 医学 
B 馆 编制 的 权威 性 主题 词 表 , 其 提供 主题 词 的 自然 信 
息 (词义 、 同 /近义词 .可 组 配 副 主 题词 等 ) ,能 够 准确 
揭示 文献 内 容 的 主题 ,与 论文 贡献 描述 内 容 密切 相关 。 
本 研究 以 学 术 论文 的 全 文本 和 MeSH 主题 词 两 类 关键 
言 息 为 数据 对 象 , 基 于 自然 语言 处 理 和 深度 学 习 技术 ， 
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开展 了 基于 深度 学 习 预 训练 模型 的 学 术 论 文 贡 献 句 识 
别 研究 。 为 实现 论文 创新 贡献 句 的 抽取 ,本 研究 主要 
开展 了 两 方面 的 工作 ,一 是 从 贡献 主题 词 的 角度 出 发 ， 
利用 自然 语言 处 理 技术 提取 论文 贡献 句 语法 特征 , 提 
出 了 论文 贡献 名 的 抽取 方法 ;二 是 基于 深度 学 习 技术 
训练 Albert 论文 贡献 句 分 类 模型 ,实现 了 对 论文 贡献 
句 的 分 类 与 识别 。 


2 相关 研究 


2.1 ”学术 论 文 创新 贡献 名 识别 

学 术 论 文 是 具有 新 的 科学 研究 成 果 或 创新 见解 和 
知识 的 科学 记录 , 某 种 已 知 原理 应 用 于 实际 中 而 取得 
新 进展 的 科学 总 结 ,用 以 提供 学 术 交 流 与 讨论 的 材料 ， 
或 是 发 表 在 学 术 刊物 上 ,或 作 其 他 用 途 的 书面 文件 ”。 
学 术 论 文 的 重要 特征 之 一 是 论文 创新 贡献 价值 , 即 论 
广电 的 观点 ,理论 .方法 等 内 容 要 素 是 否 具有 发 现 新 的 
问题 .解决 现 有 难题 ,促进 学 科 发 展 等 方面 的 贡献 价 


二 目前 ,国内 外 关于 学 术 论文 创新 贡献 点 的 直接 研 


帘 栅 少 。 李 如 森 等 认为 科技 论文 的 创新 点 分 布 在 文章 
的 考题 技术 背景 .技术 方法 ,结论 等 部 分 中 ,体现 出 科 


挡 恰 文 的 创新 点 的 分 布 并 不 限于 特定 的 音节 部 分 ,而 


是 位 能 出 现在 论文 全 文 的 各 个 部 分 。 温 有 奎 等 "提出 
论 变 创新 点 动态 挖掘 模板 ,以 句子 中 的 特征 词 作为 抽 
联 畏 征 项 ,实现 科技 文献 中 科研 创新 点 碎片 的 动态 控 
据 > 张 帆 等 "以 领域 词 表 和 本 体 中 的 关系 为 基础 , 实 
现 子 基 于 识别 规则 和 补充 规则 对 论文 中 创新 句 的 抽 
Wie saei RE T SER IG OC PHAR BD E 
点 句 的 特征 和 规律 ,将 亮点 分 为 研究 创新 型 亮点 ,研究 
方法 型 亮点 .研究 过 程 型 亮点 与 研究 结论 型 亮点 4 类 ， 
得 出 亮点 句 主要 分 布 于 论文 的 研究 结果 与 研究 方法 部 
分 ,并 在 各 个 章节 中 无 序 随机 分 布 。 章 成 志 等 "以 图 
书 情报 档案 学 科 为 例 ,通过 基于 规则 的 方法 抽取 了 创 
新 研究 评价 句 ,将 评价 句 分 为 概念 理论 类 、 观 点 发 现 
类 .模型 方法 类 ,派别 领域 类 系统 软件 类 和 实践 应 用 
类 6 种 类 型 ,发 现 评价 句 主要 与 概念 理论 相关 上 且 较 多 
处 于 论文 靠 前 的 位 置 。 草 树 金 等 从 句子 级 创新 性 识 
别 出 发 ,将 句子 的 创新 类 型 总 结 为 理论 创新 .观点 \ 概 
念 创新 ,研究 方法 创新 ,研究 问题 \ 对 象 创新 4 大 类 , 抽 
取 了 国内 外 两 种 期 刊 的 论文 的 创新 表达 范式 。 温 浩 中 
首先 根据 句法 和 语义 功能 利用 支持 向 量 机 将 科技 论文 
的 摘要 分 为 6 类 ,然后 对 不 同类 别 的 数量 分 布 和 句子 
位 置 进行 统计 ,并 分 析 了 句子 类 型 和 句子 语义 位 置 结 


构 特征 。 周 海 晨 等 ”结合 深度 学 习 和 规则 的 方法 , 提 
出 了 学 术 创新 贡献 识别 方法 以 识别 文章 中 的 创新 短 
语 , 但 仅 在 少量 数据 集 上 进行 了 模型 训练 ,并 未 仔细 阅 
述 创新 短语 和 贡献 短语 这 两 个 类 别 标 签 之 间 的 差异 。 
L. L. Chen 等 "… 利用 词性 标记 的 方法 提取 N-gram 作 
为 候选 单词 ,并 通过 检查 Scopus? 数据 库 以 确定 其 是 
否 出 现 过 从 而 判断 主题 词 的 创新 贡献 价值 。J. Allan 
等 '” 认为 新 词 很 可 能 揭示 论文 作者 所 提出 的 新 概念 、 
新 指标 以 及 做 出 的 新 贡献 等 ,利用 句子 中 出 现 新 词 的 
个 数 ,筛选 文本 中 的 新 颖 性 句子 ,在 TREC 2002 新 颖 探 
测 任务 中 取得 了 较 好 的 效果 。S，Teufel ”等 利用 学 术 
论文 写作 中 的 修辞 现象 ,通过 文本 提取 的 方法 ,抽取 或 
总 结论 文 对 研究 背景 的 创新 贡献 ,但 是 存在 较 多 的 品 
声 单元 ,分 类 的 准确 性 相对 较 低 。K.， Heffeman ”等 将 
学 术 研 究 的 贡献 定义 为 学 术 文 本 中 的 问题 及 对 应 的 解 
决 方案 ,利用 机 器 学 习 的 方法 定义 了 一 组 与 目标 类 别 
相关 的 15 个 特征 ,在 ACL 数据 集 种 可 以 较 好 地 区 分 
问题 . 非 问题 .解决 方案 。 
2.2 ”学术 文本 抽取 与 表征 

学 术 文本 贡献 句 识别 研究 主要 用 到 文本 信息 抽取 
与 识别 技术 。 常 见 的 信息 抽取 主要 包括 两 方面 内 容 ， 
即 目标 属性 的 抽取 和 目标 之 间 关 系 的 抽取 。 信 息 抽 取 
领域 的 国际 评测 会 议 Message Understanding Conference 
制定 了 具体 的 任务 和 严格 的 信息 抽取 评估 体系 ,核心 
内 容 包 括 命名 实体 识别 、 共 指 消解 .关系 抽取 、 事 件 抽 
取 等 具体 内 容 。 目 前 ,学 术 文 本 信息 提取 最 主要 的 方 
法 包括 基于 知识 的 方法 和 基于 机 器 学 习 的 方法 。 基 于 
知识 的 方法 是 依靠 领域 专家 编制 规则 ,将 相应 实体 加 
入 预先 编制 好 的 框架 中 ,使 系统 能 处 理 特定 的 信息 抽 
取 问 题 。 例 如 冷 伏 海 等 ”首先 阅读 高 质量 领域 综述 
性 文献 ,对 科技 文献 进行 语义 标注 ,得 到 领域 相关 学 术 
术语 ,制定 相应 规则 抽取 文献 中 领域 研究 相关 的 关键 
性 能 指标 。 毛 琛 瑜 等 ”通过 句 式 分 析 、 词 频 统计 、 共 
现 分 析 等 方法 ,分 析 中 文科 技 文献 中 新 发 现 语言 描述 
模式 ,找到 了 新 发 现 语言 的 特征 搭配 。 

文本 抽取 是 文本 表示 的 前 提 , 在 抽取 出 特征 文本 
后 ,需要 对 非 结构 化 的 文本 进行 字 词 编码 ,将 其 转换 为 
计算 机 可 识别 .可 计算 的 数值 形式 , 即 对 文本 进行 向 量 
化 表示 。 最 早 使 用 的 文本 向 量化 表示 方法 是 独 热 
( One-Hot ) 编码 ,该 方法 将 文本 划分 为 独立 的 单词 ,在 
词汇 表 中 每 个 单词 被 表示 为 索引 位 置 为 1, 其 他 位 置 
为 0 的 向 量 。 该 方法 的 特点 是 简单 ,但 没有 考虑 单词 
之 间 的 联系 和 相似 性 ,不 包含 单词 之 间 的 语义 相似 性 。 
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针对 此 , T. Mikolov 提出 了 分 布 式 表 示 模 型 
Word2vec ,对 词汇 与 词汇 之 间 的 语义 关系 进行 建 
模 ,与 One-Hot 向 量 不 同 , 词 向 量 是 一 个 维度 较 低 的 稠 
密 向 量 , 词 向 量 与 神经 网 络 的 结合 ,大 大 促进 了 自然 语 
言 处 理 任务 的 效率 和 效果 。 词 向 量 分 为 静态 词 向 量 和 
动态 词 向 量 ,静态 词 向 量 在 上 下 文 发 生变 化 时 也 只 能 
表示 一 个 单词 ,例如 Word2Vec 和 Glove 模型 ,无 法 
坚决 一 词 多 义 的 问题 ;而 动态 词 向 量 会 根据 词 的 上 下 
文 动态 地 调整 词 向 量 。 动 态 词 向 量 包 括 一 些 预 训练 模 
型 , 如 EIMo ( Embedding from Language Models ) 、 
BERT "' ( Bidirectional Encoder Representations from 
Transformers) 等 。 预 训练 语言 模型 能 够 基于 上 下 文 捕 
获 词语 的 深层 语义 信息 ,通过 大 规模 语 料 训练 学 习 到 
的 特征 对 词语 进行 上 下 文 特征 表示 。 鲁 威 5 对 多 因 
素 网 文本 分 类 进行 了 研究 ,利用 Elmo 模型 根据 上 下 文 
请 弄 的 不 同 将 词 映射 为 不 同 的 向 量 ,验证 了 Elmo 动态 
请 同 量 相 较 于 静态 词 向 量 的 优势 。 顾 亦 然 等 “针对 
六 i 领 域 专 业 实体 识别 困难 、 精 度 低 等 问题 ,利用 
BERT 模型 捕获 上 下 文 语义 表示 动态 生成 词 向 量 ,并 结 
tr Kc fei ic AZ £6 Id 4 ( BILSTM ) 和 条 件 随 机 场 
(ERF ) 实 现 了 中 文 命名 实体 识别 ,实验 证 明 该 方法 优 
也 各 他 算法 模型 ,能 有 效 解决 该 领域 实体 边界 模糊 且 
难 证 识别 的 问题 。 雇 胜 兰 等 ” 基于 对 话 系统 中 的 意 
图 癣 类 问题 ,采用 预 训练 模型 和 知识 蒸馏 等 技术 ,提出 
个 基于 BERT 模型 的 知识 蒸馏 意图 分 类 模型 ,在 
原 窒 数据 和 计算 资源 的 基础 上 将 意图 分 类 的 准确 率 提 
HESH. 
2:85 Albert 预 训练 语言 模型 

在 BERT 出 现 之 前 , 预 训练 模型 多 为 单 向 模型 ,如 
GPT 单 向 训练 模型 ,ELMo 模型 虽然 是 双向 但 训练 过 程 
是 分 开 的 。BERT 是 一 个 完全 的 双向 语言 模型 ,其 训练 
结果 表明 双向 语言 模型 相 较 于 单 向 语言 模型 对 文本 语 
义 的 理解 更 加 深刻 。BERT 是 一 种 基于 Transformers 结 
构 的 双向 语言 模型 ,在 预 训练 任务 中 采用 了 掩 码 语言 
模型 ( MLM, Masked Language Model) ) 和 下 一 句 预 测 
(NSP ,Next Sentence Predict ) 。 


Embedding Parameterization ) . 跨 层 参数 共享 ( Cross-layer 
Parameter Sharing) 和 句子 顺序 预测 ( Sentence-order Pre- 
diction,SOP) 。 上 述 改变 使 得 Albert 成 为 自然 语言 处 
理 任务 中 效果 最 出 色 的 模型 之 一 ,在 数据 量 较 小 的 情 
况 下 该 模型 的 优势 也 更 加 显著 。 本 研究 通过 使 用 Al- 
bert 模型 完成 贡献 句 的 句子 特征 抽取 ,训练 学 术 论 文 
贡献 句 识别 模型 ,达到 识别 论文 中 贡献 句 的 目的 。 

3 学术 论文 贡献 名 内 涵 与 筛选 

3.1 SÉRIE SCR BR POR 

学 术 论 文 的 贡献 (contribution ) 是 指 当前 的 研究 能 
对 现 有 理论 实践 作出 的 改进 、 完 善 与 应 用 ,通常 贡献 
点 包含 论文 的 研究 意义 研究 价值 .研究 影响 等 方面 ， 
是 论文 价值 的 集中 体现 。 论 文 贡献 内 容 是 论文 中 存在 
与 现 有 文献 不 同 的 知识 单元 文字 描述 .公式 算法 和 
像 表 格 等 论文 元 素 ,反映 在 创新 点 的 创新 价值 与 贡献 
程度 两 个 方面 。 

在 创新 贡献 的 要 素 与 评价 研究 方面 ,C. J. Den- 
holm ^ 从 单个 学 科 的 维度 对 创新 贡献 进行 了 界定 ,并 
从 不 同学 科 的 视角 总 结 了 博士 论文 创新 评价 指标 , 指 
出 不 同学 科 之 间 由 于 学 科 自 身 特 质 .学科 文 化 等 差异 ， 
对 于 创新 性 标准 的 理解 和 评价 存在 较 大 差异 。T. 
Dahl ”构建 了 一 个 表征 论文 新 的 研究 贡献 的 特征 词 
表 , 以 自动 识别 论文 中 的 创新 贡献 点 ,然而 该 方法 依赖 
领域 专家 且 不 能 涵盖 所 有 的 特征 和 规则 。 李 瑛 ”等 
认为 科技 期 刊 论 文 创新 贡献 的 合理 呈现 必须 包括 8 个 
要 素 , 即 创新 方面 、 创 新 类 型 .创新 内 容 、 创 新 程度 、 创 
新 质量 、 创 新 价值 .创新 缺陷 和 表达 位 置 。 李 贺 等 
以 知识 元 研究 为 基础 ,从 内 容 角 度 将 学 术 论 文 创新 分 
为 研究 问题 创新 、 理 论 创 新 方法 创新 及 结论 创新 4 个 
维度 ,基于 其 构建 了 学 术 论 文 知 识 元 本 体 模型 和 创新 
性 评价 方法 ,并 对 《图 书 情 报 工 作 》2015 年 至 2017 年 
发 表 的 文章 的 创新 性 进行 度量 ,但 存在 部 分 论文 的 测 
度 结果 创新 性 得 分 为 0 的 情况 ,计算 方法 上 还 有 待 调 
整 ,但 该 研究 提出 了 一 套 丰 富 的 理论 模型 ,在 理论 方法 
层面 为 本 研究 的 贡献 句 智能 识别 研究 提供 了 一 定 的 参 


2019 年 ,谷歌 的 Z. Z. Lan 等 发 现 当 BERT 模型 复 
杂 到 一 定 的 程度 时 , 随 着 模型 参数 增加 ,模型 的 训练 效 
果 反 而 会 下 降 ,为 此 其 提出 了 Albert (A Lite BERT) ^" 
模型 ,该 模型 在 BERT 模型 的 基础 上 做 了 模型 压缩 与 
优化 ,使 其 能 够 在 参数 规模 上 得 到 降低 ,同时 在 一 定 程 
度 上 提升 模型 训练 效果 。Albert 在 BERT 的 基础 上 引 
AT 3 种 优化 策略 : 因 式 分 解 嵌 和 人 层 和 矩阵 (Factorized 


考 。 

作为 科研 工作 者 创新 成 果 的 载体 和 文字 表述 ,学 
术 论 文 创 新 贡献 句 是 知识 创新 贡献 .技术 创新 贡献 .应 
用 创新 的 文字 体现 ,具备 创新 贡献 价值 的 成 果 应 具有 
科学 性 .新颖 性 实用 性 等 特点 。 目 前 对 学 术 论文 创新 
贡献 句 的 内 涵 还 没有 统一 的 界定 ,但 通过 文献 梳理 和 
调研 发 现 学 术 论 文中 的 贡献 名 的 分 布 与 描述 具有 以 下 
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特点 : 

(1) 从 贡献 内 容 来 看 , 即 论文 所 承载 的 具体 研究 
贡献 ,学 术 内 容 贡 献 句 内 容 维 度 如 图 1 所 示 , 具 体内 容 
包括 :中 研究 问题 贡献 , 即 开辟 新 的 研究 领域 ,提出 新 


空白 或 瓶 绒 的 研究 突破 ,或 对 现 有 研究 不 足 与 存在 问 
题 的 改进 与 完善 ;@ 理 论 研 究 贡 献 , 即 针对 已 有 的 问题 
提出 新 的 观点 、 见 解 . 思 路、 理论 模型 或 框架 ,发 现 新 规 
律 \, 提 出 新 假说 或 新 理念 ;@ 研 究 方法 贡献 ,提出 了 研 
究 问 题 或 解决 问题 的 新 视角 ,采用 了 新 的 试 ( 实 ) 验 和 
操作 方法 .论证 或 计算 方法 ,引进 或 提出 新 的 技术 或 方 
法 ;中 成 果 与 应 用 贡献 ,做 出 了 新 的 发 明 或 设计 , 现 有 
的 方法 或 技术 应 用 在 新 领域 中 ,或 者 拓展 了 其 应 用 范 


Wc 
a r—» 研究 问题 贡献 
P T 
理论 研究 贡献 
e FA 
e 学 术 论 文 贡献 句 
" 内 容 维度 
er —- 研究 方法 贡献 
e 
co 
N > 成 果 与 应 用 贡献 
O eM, os 二 二 EROS 
x F ANANA [^J A ES 
图 1 术 内 容 贡 献 名 内 容 维 度 


(2) 从 位 置 分 布 来 看 ,学 术 论 文 的 贡献 句 立 足 于 
学 术 论 文 全 文 ,可 能 出 现在 标题 、 摘 要、 引言 .正文 、 结 
论 等 不 同位 置 , 即 分 布 于 全 文 的 各 个 章节 或 段落 。 

(3) 从 研究 价值 与 意义 层面 来 看 ,贡献 句 是 学 术 
论文 核心 价值 的 文字 体现 ,学 术 论文 贡献 句 能 让 读者 
直接 准确 地 领略 到 作者 研究 贡献 ,具有 传达 创新 观 
点 ` 分享 新 成 果 ,传播 知识 的 功能 。 

3.2. 数据 选择 与 预 处 理 

医学 主题 词 表 (Medical Subject Headings , MeSH ) 是 
一 部 由 美国 国立 医学 图 书馆 编制 的 规范 化 的 可 扩充 的 
动态 性 叙 词 表 , 美 国 国立 医学 图 书馆 以 其 作为 生物 医学 
标 引 依据 建立 了 国际 上 最 权威 的 生物 医学 文献 数据 
库 一 一 MEDLINE。PubMed 是 互联 网 上 使 用 最 广泛 的 学 
术 搜 索引 警 之 一 ,提供 生物 医学 论文 和 摘要 数据 检索 服 
务 ,其 数据 来 自 MEDLINE 数据 库 。MEDLINE 为 其 中 收 
录 的 每 篇 文献 提供 了 相对 应 的 MeSH. 主题 词 ,该 主题 词 
经 过 专家 人 工 标注 和 标准 规范 化 处 理 ,是 规范 化 的 检索 
语言 ,能 够 集中 体现 文章 的 核心 贡献 内 容 ,保证 了 主题 
词 标注 的 准确 性 。MeSH 主题 词 表 于 1989 年 正式 出 版 ， 
为 提高 数据 质量 ,笔者 获取 了 PubMed 数据 库 中 1989 年 
至 2015 年 间 所 收录 的 论文 全 文 和 MeSH tree 2015 ,构建 
了 学 术 论 文 贡献 句 抽取 数据 集 ,包括 论文 的 全 文 数据 、 


Hj 


XIV 


localhost 
E acm article 


a E information schema 
E mysql 


id PMCID PMID sentence 
[inns 284556 PMC3804280 24187659 
uH. 284557 PMC3804280 24187659 
fei 284558 PMC3804280 24187659 
du das 284559 PMC3804280 24187659 
B novetyoste 284560 PMC3804280 ^ 24187659 
gi m 284561 PMC3804280 ^ 24187659 
E word nov 284562 PMC3804280 24187659 
Bis 284563 PMC3804280 ^ 24187659 
284564 PMC3804280 24187659 
284565 PMC3804280 24187659 
284566 PMC3804280 24187659 
284567 PMC3804280 24187659 
284568 PMC3804280 24187659 
284569 PMC3804280 24187659 
284570 PMC4022116 24877149 
284571 PMC4022116 24877149 
284572 PMC4022116 ^ 24877149 
284573 PMC4022116 ^ 24877149 
284574 PMC4022116 — 24877149 
284575 PMC4022116 24877149 
284576 PMC4022116 24877149 
284577 PMC4022116 24877149 
284578 PMC4022116 24877149 
284579 PMC4022116 24877149 
284580 PMC4022116 24877149 
284581 PMC4022116 — 24877149 
284582 PMC4022116 24877149 
284583 PMC4022116 24877149 
284584 PMC4022116 — 24877149 


FA result novelty (localhost) - 3 


Gress [ck Y uk |]sgk Masu 


题 录 信息 和 Mesh. 主题 词 ,数据 信息 如 图 2 所 示 : 


lemma_sentence tag sentence tag 
In fact, Beauveria bassiana is one of thein fact , beauveria bassiana bin fact , **beauveria* TW bassiana beTW TW VB 4299 
Considering that there is a high geneticconsider that there be a higFconsider that there be a #high#TW TW TW TW4299 
This study was undertaken to assess th«this study be undertake to asthis #study#NN be undertake to as:NN TW TW4299 
The evaluation was performed in the sathe evaluation be perform inthe evaluation NN be perform in ‘NN TW NN4299 
Biotic and abiotic factors have been reFbiotic and abiotic factor havebiotic and abiotic factor have be #rtVB TW TW 4299 
Population levels of live adults of C. sorpopulation level of live adult£population*TW level of #live#TW TW TW TW4299 
However, mainly in Mutuípe, a higher ahowever , mainly in mutuípe however , mainly in mutuípe , a #hitAD TW TW 4299 
Higher mortality was found for chemicchigher mortality be find for c#higher#AD #mortality#TW be #finAD TW VB 4299 
Since the plots presented similar conditsince the plot present similarsince the plot #present#VB similar {VB TW TW 4299 
The mortality registered for the entomcthe mortality register for the the *mortality**TW register for the (TW TW VB 4299 
Isolate CNPMF 218 was the most effectisolate cnpmf 218 be the moisolate cnpmf 218 be the most effi TW TW TW4299 
Although those values are lower than tlalthough those value be lowalthough those value be lower*TVTW VB TW 4299 
As mentioned before, studies conducteas mention before , study coas mention before , studystNN corNN TW TW4299 
Thus, the biological control applied is athus , the biological control «thus , the &biological*TW #controHTW TW TW4299 
Based on recent advances in our under:base on recent advance in wibase on recent advance in #we#RF RF TW RF V4300 
In this paper, we review recent progressin this paper , we review recein this *paper£TW , *we£RF strevie TW RF TW 4300 
Nocturnal increase in AANAT enzymaticnocturnal increase in aa nat «nocturnal increase in aa nat enzymaNN TW TW4300 
As mentioned above, several homeoboas mention above , several has mention above , several &homeo TW TW VB 4300 
As reviewed below, a set of homeobox as review below , a set of hoias #review#TW below , a set of #ho TW TW TW4300 
During development, Crx is expressed i during development , crx be during development , crx be expresTW TW TW4300 
Around the same embryonic stage, Crx around the same embryonic around the same fembryonic£TW sTW VB TW 4300 
However, in a mouse with conditional Chowever , in a mouse with cchowever , in a &Àmouses TW with coiTW TW TW4300 
Interestingly, several homeobox genes interestingly , several homeointerestingly , several #homeobox# TW TW VB 4300 
Investigations in a Crx-knockout mouseinvestigation in a crx-knocko*investigation*NN in a crx-knockouNN TW VB 4300 
In vitro studies have shown that the CRin vitro study have show thatin vitro **studys* NN have #show#VBNN VB TW 4300 
NRL and CRX have been shown to transnrl and crx have be show to hammalian#TW #pineal gland#TW .VB TW TW 4300 
Thus, a similar cooperation between NFthus , a similar cooperation kthus , a similar cooperation betweeiNN TW TW4300 
In the adult rat pineal gland, many of ttin the adult rat pineal gland ,in the #adult#TW #rat#TW #pineal TW TW TW4300 
The daily expression profiles, existing dthe daily expression profile , the daily expression profile , exist NN TW TW4300 


图 2 ”学术 论文 贡献 句 抽取 数据 集 ( 部分) 


paper ic^ 


本 研究 的 原始 实验 数据 为 英文 格式 的 nxml 文档 ， 
其 中 包含 了 无 用 的 标签 信息 ,需要 进行 文本 清洗 与 预 


处 理 操作 。 通 过 编写 相应 规则 将 格式 转换 为 纯 文本 格 
3X ,提取 nxml 格式 中 对 应 标题 \、 正 文 .小 节 语 义 片段 的 
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FPR, RR, 钱 佳 佳 ,等 . 学 术 论 文 创新 贡献 名 识别 研究 [J]. 图 书 情报 工作 ,2021 ,65(12) :93 - 100. 


信息 ,删除 多 余 的 标签 信息 ,利用 停 用 词 表 去 除 噪 音信 
息 。 构 建 txt 格式 的 数据 集 后 ,为 有 效 实 现 贡 献 句 抽 
取 , 需 要 对 数据 进行 预 处 理 , 包 括 对 实验 句子 集中 的 每 
条 句子 进行 分 词 ,对 文本 序列 进行 词性 标注 ,以 及 对 文 
本 进行 词 形 还 原 ,最 终 将 处 理 后 的 数据 储存 在 不 同 的 
文件 中 , 供 后 续 句 子 抽取 使 用 。 
3.3 基于 MeSH 主题 词 概念 名 抽取 与 筛选 
单 篇 文章 的 MeSH 主题 词 是 领域 专家 对 整 篇 论文 


研究 工作 的 高 度 概括 ,涵盖 了 文献 中 已 经 涉及 或 可 能 
相关 的 所 有 知识 元 ,具有 体现 论文 研究 主题 和 贡献 点 
的 作用 , 主题 词 与 句法 特征 的 结合 将 为 学 术 文本 创新 
贡献 句 的 挖掘 提供 重要 线索 。 本 研究 采用 的 贡献 句 抽 
取 方 法 的 处 理 流 程 主 要 包括 MeSH. 主题 词 提 取 、 论 文 
贡献 句 的 引导 词 标注 、. 基 于 规则 的 贡献 句 筛选 3 个 步 
又 ,如 图 3 所 示 : 


引导 词 标注 L— 


规则 筛选 


e x 提取 MeSH. 主题 词 —M9 


图 3 论文 贡献 句 抽取 流程 


S. Mishra 等 以 MEDLINE 中 收录 的 论文 为 研究 
对 象 ,使 用 分 配给 文章 的 医学 主题 词 ( MeSH) 标识 , 提 
出 对 科学 论文 中 的 时 间 新 颖 性 ,空间 新 颖 性 .组 合 时 间 
新 器 性 组 合 空间 新 颖 性 4 种 新 颖 性 度量 方法 。 笔 者 


的 句子 进行 预 处 理 , 对 词 进 行 词性 判断 与 词性 还 原 。 
其 次 ,采用 最 大 双向 匹配 算法 在 不 同类 型 的 词 表 中 对 
词 进行 查询 匹配 ,对 得 到 的 结果 进行 比较 ,选择 匹配 后 
在 词 库 中 词 数 最 多 的 方式 为 正确 的 分 词 方 法 ,继而 对 


[35 S. Mishra 提出 的 度量 方式 ,根据 计算 出 的 单 篇 文 
SEPH MeSH 词 的 新 颖 性 得 分 对 论文 全 文句 子 进 行 第 
ioi pos e re t. 首先 ,从 实验 数据 集中 随 
机 选择 4 300 篇 文献 ,获取 每 篇 文献 的 句子 集 和 MeSH 
疾 题 词 集 , 共 得 到 文献 的 句子 集 658 760 ^] ,平均 每 篇 
诊 这 的 句子 数量 为 153. 2 句 , 单 篇 论文 句子 数 最 少 为 
92 柯 ,最 多 为 281 句 。 其 次 ,通过 判断 句子 中 是 否 含有 
该 奖章 中 新 颖 的 主题 词 或 主题 词 对 , 若 包 含 则 添加 到 
便于 贡献 句 集中 , 若 不 包含 则 将 其 舍 去 。 最 后 ,得 到 候 
选 珊 献 句 子 集 共 284 584 句 , 占 总 句 数 的 43.2%。 本 
研究 梳理 了 一 套 论文 贡献 句 特征 引导 词 表 , 共 6 类 贡 
献 合 特 征 引导 词 , 类 型 与 示例 如 表 1 所 示 。6 类 语言 
学 竹 征 引导 词 来 自 对 医学 研究 领域 的 文献 调研 ,并 通 
过 构建 词 表 主 体 和 分 析 医 学 领域 贡献 句 词 频 ,选取 贡 
献 句 中 的 高 频 通用 词 加 以 补充 。 此 外 ,领域 主题 词 表 
由 MeSH tree 2015 解构 得 到 ,通过 遍历 树 中 所 有 根 节 
点 , 即 所 有 下 位 词 ,去 掉 重复 部 分 ,得 到 领域 主题 词 表 。 
表 1 贡献 名 特征 引导 词 表 


类 型 引导 词 示 例 
指 代 作者 I,we,our,the author 等 
ü 5L this paper/article/publication/report/letter/context , this study 

指 代 研究 his paper/article/publication/report/ letter/. hi ly/ 
research ,this contribution/method/ result 等 

特征 动词 put foraward „find „reveal \illustrate , suggest , improve , design , de- 
velop , present , propose ,shown 等 

特征 名 词 insight , finding , analysis , investigation , solution , aim , objective , 


purpose ,goal 等 
特征 形容 词 ” novel .new state of the art „better „stronger unused 等 


A 


xig 和 


首先 ,根据 6 类 特征 引导 词 ,对 候选 贡献 句子 集中 


genome ,bezoars ,cardiology , myelophthisic 


实验 句子 进行 标注 。 再 次 ,将 标注 结果 与 词 原型 序列 
分 离 ,得 到 句子 标注 序列 。 最 后 ,编写 正则 表达 式 对 名 
子 标注 序列 进行 匹配 ,抽取 符合 规则 的 句子 标注 序列 
及 其 对 应 的 原文 ,从 而 得 到 候选 贡献 句 集 。 
4 ”学术 论文 贡献 句 识别 
4.1 实验 设计 与 数据 标注 

本 研究 使 用 候选 贡献 句 集合 作为 实验 的 标注 对 
象 ,从 4 400 篇 医学 领域 文献 中 随机 选取 60 篇 作为 标 
注 实 验 的 样本 ,这 60 篇 文献 涵盖 了 多 种 不 同 的 医学 领 
域 ,在 一 定 程度 上 保证 了 实验 样本 的 广泛 性 。 标 注 样 
本 中 共 出 现 候选 贡献 句 2 936 条 ,其 中 包括 正 样 本 
2 034 条 , 负 样 本 902 条 。 为 了 确保 标注 的 客观 性 , 笔 
者 利用 Kappa. 系数 对 标注 结果 进行 一 致 性 评 佑 ,选取 
了 3 位 标注 者 共同 标注 的 15 篇 文献 ( 共 包 括 516 个 名 
子 ) 做 交叉 检验 ,计算 得 出 Kappa 一 致 性 系数 为 0.7。 
根据 S，Teufel ”给 出 的 一 致 性 参考 指标 (人 >0. 69 , 表 
示 可 靠 ) ,可 以 发 现 ,本 研究 的 标注 结果 达到 了 相对 可 
靠 的 一 致 性 水 平 。 

论文 贡献 句 抽取 能 够 帮助 读者 了 解 作者 的 研究 中 
取得 了 哪些 成 果 。 但 是 从 文本 内 容 角 度 来 看 ,贡献 名 
的 判断 往往 依靠 同行 评议 者 的 主观 判断 , 受 限 于 评议 
者 的 认 知 与 经 验 。 针 对 这 一 问题 ,本 研究 则 在 有 效 利 
有 论文 全 文 和 主题 信息 ,为 论文 创新 贡献 句 难于 发 现 
这 一 问题 提供 解决 思路 。 首 先 ,利用 自然 语言 处 理 技 
术 对 全 文本 进行 数据 噪音 去 除 、 分 词 、 去 停 用 词 等 操 
作 ; 其 次 ,根据 贡献 句 抽取 规则 并 结合 单 篇 文章 的 
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Mesh 主题 词 ,从 全 文本 中 抽取 候选 贡献 句 ;再 次 ,结合 
领域 词 表 和 特征 词 表 , 对 抽取 出 来 的 候选 页 献 句 进行 
第 选 , 形 成 候选 页 献 句 集合 ;接着 ,采用 半自动 的 方式 对 
候选 贡献 句 进行 二 分 类 标注 , 正 样 本 为 符合 论文 贡献 句 

地 征 的 句子 , 负 样 本 为 规则 识别 为 贡献 句 而 从 实际 上 下 
文 语 境 来 看 不 符合 实际 贡献 句 的 句子 ;最 后 ,将 标注 的 
数据 按照 6:1 的 比例 分 配 训练 集 和 测试 集 ,采用 Albert 
模型 训练 贡献 句 识别 模型 ,通过 多 次 参数 调整 与 模型 优 
化 ,最 终生 成 页 献 名 识别 模型 并 实现 对 论文 贡献 句 的 识 
别 。 学 术 论 文 贡献 句 识别 流程 如 图 4 所 示 : 


wr] 
eue 论文 全 文本 单 篇 MeSH 
S E 数据 集 主题 词 
和 
o 
NS 一 
LO =A 
文本 预 处 理 
CO | eism 
= | 
e 一 一 一 一 、 规则 匹配 ”| — 
—— 

E 特征 词 表 | 
e 
CN sue o FERRA 
"ma 语句 集 
BENE 
X 论文 贡献 名 Abn | 数据 标注 
a 模型 训练 
C 
c El4 学 术 论文 贡献 句 识别 方法 流程 


P 模型 训练 与 评估 

完成 数据 的 标注 后 ,在 训练 集 上 用 Albert 模型 进 
行 模型 训练 ,并 在 测试 集 上 进行 测试 ,本 研究 中 所 有 的 
实验 均 在 如 表 2 所 示 的 实验 环境 中 完成 。 将 Albert 模 
型 的 Batch size 设置 为 32 ,设置 最 大 名 长 为 256 ,不 断 
调整 实验 的 其 他 超 参数 ,多 次 运行 程序 ,记录 在 验证 集 
上 表现 最 优 的 组 合 。 多 次 实验 调 参 后 将 globle_step 设 
置 为 1 500 ,每 隔 20 步 保存 一 次 模型 ,计算 在 测试 集 上 
的 实验 准确 率 。 通 过 参数 调整 和 多 次 实验 测试 ,笔者 
发 现 无 论 是 在 训练 集 上 还 是 测试 集 上 ,模型 的 准确 率 
都 在 90% 以 上 ,达到 了 较 高 的 水 平 。 

此 外 ,本 研究 还 将 Albert 的 实验 结果 与 其 他 深度 
学 习 模型 ( FastText .TextCNN , Text RNN ) 和 预 训 练 模型 
(BERT 和 XLNet) 进行 对 比 实验 ,比较 不 同 深度 学 习 模 
型 在 贡献 句 分 类 上 的 具体 表现 。 在 参数 设置 过 程 中 ， 


表 2 实验 环境 及 配置 


实验 环境 环境 配置 
操作 系统 Ubuntu16. 04 
GPU NVIDIA Tesla T4 
内 存 32G 
编程 语言 Python3. 6 
深度 学 习 框 架 TensorFlowl. 15 
CUDA 版 本 CUDA 11.1 


本 研究 尽 可 能 保证 6 种 模型 在 参数 设置 上 的 一 致 性 。 
在 模型 结构 差异 导致 无 法 取得 一 致 的 情况 下 , 取 参 数 
的 最 优 设置 。 其 他 深度 学 习 模 型 FastText , TextiCNN 、 
TextRNN 采用 的 词 向 量 维度 为 128; 预 训练 模型 中 ， 
BERT 的 注意 力 头 数 使 用 8 头 。 为 了 避免 结果 的 偶然 
性 ,多 次 运行 程序 ,通过 平均 值 进行 比较 ,具体 结果 如 
表 3 所 示 : 
RI 不 同 模型 在 贡献 甸 分 类 上 的 实验 结果 


分 类 模型 精确 率 /% 召回 率 /% F1/96 准确 率 /% 
Textcnn 79.54 80.45 79.99 79.71 
Textrnn 81.31 81.47 81.39 80. 90 
Fasttext 80. 93 82.97 81.94 81.86 

Xlnet 89. 64 90. 59 90.11 89. 73 
BERT 88. 77 89.82 89.29 89. 49 
Albert 91.97 91.52 91.74 91.60 


4.3 ”实验 结果 分 析 

实验 数据 表明 ,针对 学 术 论文 中 的 贡献 句 识别 问 
题 , 相 对 于 传统 深度 学 习 方法 , 预 训练 模型 在 精确 率 、 
召回 率 Fl 值 和 准确 率 值 上 都 取得 了 明显 的 优势 , 同 
时 不 同 预 训练 模型 间 的 差异 较 小 ,与 在 其 他 分 类 任务 
上 的 结果 相似 。 其 中 ,本 研究 训练 的 Albert 模型 的 上 
述 各 项 指标 均 取 得 最 好 的 效果 。 

为 进一步 检验 Albert 模型 的 效果 ,假设 BERT XL- 
Net , Albert 这 3 种 不 同 的 深度 学 习 模 型 性 能 相同 ,彼此 
之 间 不 存在 显著 性 差异 ,对 模型 的 结果 进行 显著 性 假 
设 检验 。 然 而 由 于 标注 样本 的 数量 有 限 , 在 使 用 交叉 
验证 等 实验 估计 方法 时 ,如 果 每 轮 次 选取 的 样本 数 较 
大 ,不 同 轮 次 的 训练 集会 有 一 定 程 度 的 重 概 ,将 导致 假 
设 成 立 的 概率 结果 计算 过 高 。 如 果 每 轮 次 选取 的 样本 
数 较 小 ,会 使 得 结果 的 偶然 性 误差 较 大 。 为 此 ,本 文采 
用 5 *2 交叉 验证 + 检验 法 ” ,将 3 种 模型 两 两 之 间 相 
互 比较 。5 * 2 交叉 验证 是 做 5 次 交叉 2 折 交 叉 检 验 ， 
在 每 次 2 折 交 义 验 证 之 前 ,随机 打 乱 数据 的 顺序 ,确保 
使 得 5 次 交 又 验证 中 的 数据 划分 不 重复 。 第 i 次 2 折 
交叉 验证 将 产生 2 对 测试 错误 率 。 对 2 对 测试 错误 率 
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分 别 求 差 , 得 到 第 一 折 上 的 差 值 A; 和 第 二 折 上 的 差 值 
Ai。 为 确保 测试 错误 率 的 独立 性 , 仅 计算 第 1 次 2 折 
交叉 验证 的 两 个 结果 平均 值 h. =0.5(A; € Aj). PET 
每 次 2 折 实 验 的 结果 计算 其 方差 o? = (Aj -0.5x (A 
+4)) € (A1 70.5 x (Aj € AD)! ,假设 成 立 的 概率 
为 : 


quer XO) 
0:22: X; 
实验 结果 表明 r = 2. 561 ,小 于 显著 度 w = 0. 05 时 
的 临界 值 2. 570 6 ,大 于 显著 度 a =0.1 时 的 临界 值 
2.015 0 ,说 明 假 设 在 显著 度 oc = 0. 1 时 不 成 立 , 即 3 种 
模型 之 间 存 在 一 定 的 显著 性 差异 ,其 中 平均 错误 率 较 
小 的 Albert 模型 性 能 较 优 。 


LO 学 术 论 文 贡献 点 的 自动 识别 是 实现 论文 智能 评价 
的 者 要 环节 ,对 科技 评价 工作 的 开展 具有 导向 和 推动 
作用 。 本 研究 针对 目前 贡献 句 抽取 研究 存在 的 不 足 ， 
DEMEDLINE 数据 库 中 的 期 刊 文献 .MeSH 主题 词 为 基 
三 ;引入 深度 学 习 文本 分 析 等 领域 的 理论 与 技术 ,从 
相信 文责 献 句 识别 方法 。 本 研究 旨 在 从 学 术 论文 全 文 
本 审 抽 取 完 整 意义 的 贡献 句 ,揭示 论文 的 贡献 点 ,为 实 
现 更 加 语义 化 、 智 能 化 的 学 术 论 文 创新 性 评价 商定 基 
础 中 通过 实验 验证 和 对 比分 析 , 证 明了 本 研究 采用 的 
Albert 模型 的 合理 性 以 及 该 模型 在 处 理 贡 献 句 分 类 问 
Mem citt. 

“本 研 究 的 意义 在 于 通过 上 述 方法 可 以 准确 地 自动 
识别 文章 中 的 贡献 句子 ,突出 论文 的 创新 性 工作 。 一 
方面 ,可 以 降低 同行 评议 中 的 审 稿 压力 ,在 创新 知识 传 
播 . 研 究 方向 梳理 等 方面 具有 较 高 的 应 用 价值 ; 另 一 方 
面 ,为 从 论文 句子 内 容 层面 评价 论文 创新 性 做 出 了 学 
试 和 基础 铺垫 ,为 构建 学 术 论 文 创新 点 识别 和 创新 性 
评价 研究 奠定 了 基础 。 
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Abstract; | Purpose/ significance | Contribution sentences of academic papers are elements to reflect the novelty 


and academic value of papers. This study takes the full text of academic papers and MeSH terms as data sources and 
uses natural language processing and deep learning techniques to achieve academic paper contribution sentence recog- 
„Mion. This study lays the foundation for fine-grained mining of innovative contents of academic texts, which is im- 
Gant for realizing the evaluation of academic papers based on cognitive computing. | Method/process | Firstly, 
the full-text PubMed papers were used as the data source for element analysis and feature extraction of the contributed 
sentences. Secondly, a semi-automatic approach was used to fulfill the data annotation. Finally, the automatic recog- 
nition of contributed sentences was realized based on Albert deep learning model. | Result/conclusion | The plausi- 
bility of the experimentally labeled training data is proved by the data consistency test, and the experimental results 
show that the automatic recognition model trained in this paper can identify the contribution sentences in academic 
papers more effectively compared with other deep learning models. 
novelty Albert 
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